Appearance
1.1 DeepSeek
摘要
该文章是硅基流动发布的“大模型API评测指南”系列首篇,以DeepSeek - R1 API评测为例,指出当下评测中存在的7个误区,旨在为评测者和用户提供参考,推动更优质的评测和API服务发展。
- 第三方R1降智问题:不能将API与App/网页端混合对比。第三方平台部署的多为“满血版R1(671B)”,使用体验差异源于模型输出随机性、平台配套功能和超参数设置不同,而非模型本身。
- 官方与第三方模型量化问题:DeepSeek官方开源R1权重是FP8量化,市面上无公开BF16版R1 。不同量化方案各有优劣,双盲测试后若API效果相近,可认为模型精度一致。
- 云平台API功能问题:DeepSeek - R1模型本身不支持联网搜索、文件上传,这些功能依赖平台或应用方开发。云服务平台面向开发者提供API,Chatbot等应用面向C端用户,功能更齐全,多数云服务平台也在增加此类功能。
- 超参数设置导致输出乱码问题:硅基流动的API支持调整Temperature,部分平台不支持。测试时若统一设置Temperature,可能使硅基流动的API输出异常,导致测试结果不准确。
- 第三方API答题准确率差异问题:单次或几次测试结果随机性大,不能代表模型真实水平。人工盲评且测试数量和数据分布足够时,若无法区分各平台模型API能力,则可认为它们相同。
- 第三方API推理字数问题:单次或几次测试结果有随机性,模型输出长度与精度无关,不能以推理字数判断平台优劣。
- 硅基流动R1测试无响应问题:不同平台资源占用情况不同,单次或几次API效果和速度测试误差大,应多次测试取平均值。硅基流动的普通版R1因免费Token用户多,易出现无输出或速度慢的情况,建议测试Pro版。
DeepSeek-R1及其蒸馏模型规格与应用表
模型名称 | 硬件需求 | 核心场景 | 典型用户群体 |
---|---|---|---|
DeepSeek-R1-1.5B | 4核CPU/8GB内存/12GB存储空间,可选4GB显存显卡 | 个人电子邮件和社交媒体短消息生成 | 学生/个人开发者 |
DeepSeek-R1-7B | 8核CPU/16GB内存/80GB存储,RTX3060(最低)或3070(推荐)显卡 | 中小型企业本地知识库问答、文档多语言互译、编程团队代码补全 | 中小创业团队 |
DeepSeek-R1-8B | 与DeepSeek-R1-7B类似 | Python基础框架代码生成、小企业AI客服 | 中小创业团队 |
DeepSeek-R1-14B | 12核以上CPU/32GB内存/RTX4090显卡(24GB显存) | 写作辅助、办公助手 | 制造业企业/政府机构 |
DeepSeek-R1-32B | 8核服务器级别CPU/64GB内存,2-4张英伟达A100(80GB显存/卡) | 金融分析、医学研究 | 金融机构/医院 |
DeepSeek-R1-70B | 32核服务器级别CPU/128GB内存/256GB存储,2xA100 80GB或4xRTX4090 | 科研机构或大型企业的高复杂度生成任务 | 科研机构/大型企业 |
DeepSeek-R1-671B | 64核CPU/512GB内存/300GB+硬盘,多节点分布式训练,如8xA100/H100显卡配置 | 超大规模AI研究 | AI科研机构/互联网公司 |
讲座
DeepSeek大模型赋能政府数字化转型(给福建省市场监督管理局的讲座实录)
摘要
这是厦门大学林子雨副教授(国内高校知名大数据教师)2025年4月8日给福建省市场监督管理局讲座的现场实录视频,讲座题目是《DeepSeek大模型赋能政府数字化转型》,获得现场听众高度评价。报告系统介绍了大模型概念、发展历程、技术原理、大模型产品、政府大模型落地方案、智能体的政务应用、AIGC应用与实践等内容。林子雨老师在2025年2月编写发布了4个面向不同群体的大模型科普报告,被国内广泛传播,全网访问量超过1000万,林子雨老师也应邀为高校、政府部门和企业做了30余场大模型科普讲座,引起强烈反响。
DeepSeek大模型赋能政府数字化转型(给福建省市场监督管理局的讲座实录)20250303_DeepSeek大模型及其企业应用实践_厦门大学_林子雨.pdf
摘要
这是厦门大学林子雨副教授(国内高校知名大数据教师)2025年4月8日给福建省市场监督管理局讲座的现场实录视频,讲座题目是《DeepSeek大模型赋能政府数字化转型》,获得现场听众高度评价。报告系统介绍了大模型概念、发展历程、技术原理、大模型产品、政府大模型落地方案、智能体的政务应用、AIGC应用与实践等内容。林子雨老师在2025年2月编写发布了4个面向不同群体的大模型科普报告,被国内广泛传播,全网访问量超过1000万,林子雨老师也应邀为高校、政府部门和企业做了30余场大模型科普讲座,引起强烈反响。
参考资料
清华大学_第二版_DeepSeek如何赋能职场应用?从提示语技巧到多场景应用.pdf
清华大学_第三版_普通人如何抓住DeepSeek红利.pdf
清华大学_第四版_DeepSeekDeepResearch:让科研像聊天一样简单.pdf
摘要
《DeepSeek 赋能数字政府应用指南》一书近日由新华出版社出版并面向全国发行,该书电子书将在国内各大数字阅读平台上线。 根据介绍,该书由中国经济信息社编写,内容聚焦人工智能技术在数字政府建设中的应用,详细阐述了其在 “高效办成一件事”、“一网通办”、政务服务大厅、12345 热线、智慧城市等多个领域中的创新探索,展现了人工智能赋能数字政府建设的生动实践,深入探讨 DeepSeek 等人工智能技术如何赋能政务服务效能提升和城市治理现代化,为从事和关注数字政府建设的各界人士提供参考。 该书围绕数字政府建设,提供了 “人工智能 +” 行动可借鉴的实践范式,帮助读者感受技术赋能下的政府治理创新与时代脉动,共同见证更加智能、高效、便民的活力中国。
新闻
摘要
DeepSeek 爆火后相关网课泛滥的现象展开讨论,核心观点是普通用户没必要购买此类网课学习,具体内容如下:
- DeepSeek网课泛滥现象:随着 DeepSeek 大模型爆火,网络上涌现大量相关付费课程。这些课程宣传噱头十足,如 “DeepSeek 7 天从 0 到精通”“利用 DeepSeek 赚到 100 万” 等。课程内容涵盖使用指令集、提示词操作 DeepSeek 以及利用它进行电商运营赚钱等方面,价格从 9.9 元到 599 元不等。
- 消费者反馈:有消费者购买课程后体验不佳。吴女士称所购课程内容基础,多为网上可查信息,所谓爆款技巧笼统且缺乏参考性,感觉上当受骗,认为钱花得不值。
- 专家观点:中国通信标准化协会互动媒体标准推进委员会副主席包冉表示,普通用户无需购买 DeepSeek 教程。如今主流 AI 包括 DeepSeek,都支持自然语言交流,无需像早期大模型那样打磨提示词。当前市面上很多教程存在不专业、不专注、不尊重开源规则的问题,用格式化提示词或指令集方式教学不适用于 DeepSeek。其推理能力已大幅提升,普通用户用自然语言就能与之交互。不过,包冉也指出,对于希望将 DeepSeek 或其他大模型部署在本地的用户,学习相关教程还是有必要的。